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摘要 :【 目 的】 窒 足 真 遇 Simulium ( Eusimulium) angustipes 属 哮 血 遇 种 ,并 传播 合 类 疾病 。 本 研究 旨 
在 通过 RNA-seq 技术 获得 罕 足 真 遇 的 转录 组 数据 ,进而 开发 其 微 卫 星 标记 ,为 罕 足 真 遇 的 种 群 遗 
传 学 研究 提供 可 靠 的 分 子 标记 。【 方 法】 以 采 自 陕西 宝鸡 和 新 疆 阿 勒 泰 地 区 的 窗 足 真 映 幼虫 为 材 
料 ,构建 转录 组 数据 库 。 使 用 软件 MISA (microsatellite identification tool) 搜索 罕 足 真 遇 unigenes 库 
中 的 所 有 SSR 位 点 ,并 随机 挑选 SSR 位 点 ,利用 软件 Primer Premier 5.0 和 Oligo 6.7 设计 微 卫 星 引 
物 。 经 PCR 扩 增 和 电泳 检测 ,用 Cervus 3.0.7 等 生物 信息 学 软件 进行 统计 分 析 , 筛 选 多 态 性 微 卫 
星 引 物 。 利 用 BlastX 比 对 Nr 和 Swiss-Prot 蛋白 质数 据 库 ,对 含 多 态 性 SSR 位 点 的 unigenes 进行 功 
能 注释 。【 结果 】 共 鉴定 出 29 471 个 SSRs。 最 丰富 的 重复 基 序 是 单 核 普 酸 重复 类 型 , 占 总 SSR 数 
的 87.05% ;其 次 是 三 核 莹 酸 重 复 类 型 , 占 7.95% 。 共 发 现 34 种 碱 基 重 复 基 序 , 主 要 是 A/T 基 序 重 
复 , 占 86.9396 , 15 对 微 卫 星 引 物 均 成 功 扩 增 出 特异 性 产物 , 含 12 对 有 具 多 态 性 的 微 卫 星 分 子 标记 。 
比 对 结果 显示 ,7 个 SSR 位 点 来 自 注 释 基因 序列 。【 结论 ] 基 于 RNA-seq 二 代 测 序 技术 可 实现 窄 足 
真 遇 SSR 分 子 标记 的 高 效率 开发 ,对 窄 足 真 映 的 种 群 店 传 学 研究 具有 重要 意义 。 
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Development of SSR primers for Simulium ( Eusimulium ) angustipes 
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Abstract: [ Aim] Simulium ( Eusimulium) angustipes is a bloodthirsty species that transmits poultry 





EI 


diseases. In this study, S. (E. ) angustipes transcriptomes were sequenced using RNA-seq technology , 
and the SSRs were developed using transcriptome datasets, which may serve as reliable molecular markers 
for population genetics research of simuliids. [ Methods] Transcriptome database of S. ( E. ) angustipes 
larvae collected from Baoji of Shaanxi and Altay of Xinjiang was constructed. The software MISA was 
used to explore all the microsatellite loci in the unigene database of S. ( E. ) angustipes. Primers were 
designed using software Primer Premier 5. 0 and Oligo 6.7 from the SSR loci chosen randomly. After PCR 
procedure and electrophoresis detection, the primers with polymorphism for SSR were screened and 
analyzed using Cervus 3. 0. 7 and other bioinformaties softwares. Unigenes with polymorphic SSR loci 
were annotated using BlastX against Nr and Swiss-Prot databases. [Results] A total of 29 471 SSRs were 
identified in S. ( E. ) angustipes transcriptome. The most frequent repeat motifs were mononucleotide 


motifs (87.0596) , followed by trinucleotide motifs (7. 9596 ). Among all the 34 SSR motifs, ( A/T)n 
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was the most abundant mononucleotide motif (86. 9396). SSR primers were synthesized, and 15 primers 


were amplified successfully, of which 12 loci were polymorphic. BlastX results indicated that seven SSR 


loci were identified from the annotated genes. [Conclusion] Based on RNA-seq sequencing technology , 


we can better realize the development of SSRs for S. ( E. ) angustipes, which is of great significance to 


the study of population genetics of this group. 


Key words: Simulium ( Eusimulium) angustipes; RNA-seq dataset; microsatellite DNA ; SSR molecular 


marker; polymorphism 


简单 重复 序列 (simple sequence repeat, SSR) X. 
被 称 作 微 卫星 DNA 或 短 串 连 重复 ,核心 序列 长 度 在 
1-6 bp 之 间 。 目前 ,这 类 分 子 标记 在 昆虫 分 子 生 
SAES, 2012) \ 种 群 遗 传 学 (Dumas et al., 
1998; Meng et al., 2008; Peccoud et al., 2009; Sun 
et al., 2012; 邢 丹 ，2013 )、 入 侵 遗 传 学 ( Zepeda- 
Paulo et al., 2010; 吴 仲 真 等 , 2011; Yang et al., 
2012; TRAE, 2016) 以 及 物种 形成 过 程 及 分 类 地 
位 的 研究 (Kent, 2009; Conflitti et al., 2014) 77 Tfi 25] 
有 大 量 应 用 , 极 大 地 促进 了 上 述 领域 的 研究 。 

但 是 , 微 卫 星 标记 制备 方法 和 过 程 繁 杂 ( 常 玉 
梅 等 , 2005) ,制约 了 其 广泛 应 用 。 新 一 代 高 通 量 测 
序 技术 的 成 熟 及 测序 成 本 的 降低 为 微 卫 星 标记 开发 
提供 了 很 大 便利 。 如 通过 全 基因 组 .表达 序列 标签 
sequence tag, EST) 和 转录 组 
(transcriptome) 3 种 数据 库 进 行 SSR 位 点 定位 和 得 
选 ,联合 Pimer Premier 等 软件 设计 出 能 扩 增 出 目的 
产物 的 特异 性 引物 ( 王 娟 娟 等 , 2016) 。 无 其 在 非 模 
式 生 物 的 微 卫星 标记 开发 方面 , 现 阶段 可 充分 利用 
EST 数据 库 和 转录 组 数据 ,大 大 提高 开发 效率 ,使 其 
广泛 应 用 于 各 类 昆虫 的 研究 当中 (Hahn et al., 
2009; 李 傲 祥 , 2010; XI TERI EP, 2010; 魏 丹 
丹 等 , 2014; HIK, 2014; Duan et al., 2017; Tang 
et al., 2017; 李 微 等 , 2017; RERE, 2017) 。 

7E fg ELE Simulium ( Eusimulium) angustipes 5 
E F Xx X8 H ( Diptera) "A8. (Simuliidae ) 3] JE 
Simulium ECBWNV gj Busimulium。 其 幼虫 生活 于 流速 
较 慢 、 较 温暖 的 河流 ,通常 容易 在 平坦 的 河流 被 采集 
到 (Ciadamidaro et al., 2016) ,也 可 在 较 小 的 河流 被 
发 现 (Klink, 2010), 7E £e EC Je FE MAIX , 常 攻 
i: 5 28, 且 是 原生 动物 寄生 虫 住 白细胞 虫 
( Leucocytozoon ) 4I E 2S ff£ 1E Jj; | Trypanosoma ( bird 
trypanosomiasis ) ] 的 传播 媒介 (Day et al., 2010) 。 
其 在 中 欧 的 猛禽 中 寄生 率 极 高 ,Ivkovit 等 (2014) 连 
续 两 年 在 普 利 特 维 采 湖 的 采集 结果 显示 , 罕 足 真 映 
的 寄生 率 分 别 达 到 99. 00% 和 97. 48% 。 其 空间 取 
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食 偏 好 冠 层 , 与 其 在 鸟 类 锥 虫 传播 中 的 作用 一 致 
(Černý et al., 2011) JESP, 7E Jg EC ve n] dE BUE 
体 , 其 中 一 些 螺旋 体 种 类 对 人 类 和 动物 有 致 病 性 
(Sikutova et al., 2010). E Bii, E 32€ T 7E Jt EC] 
Bb DLER FESR , B] FOE 7E EE UESE e f nn 
于 其 区 系 调 查 (Lewis ，1966; Crosskey et al., 1996; 
Kalafat and Şirin, 2011) .生态 习性 和 流行 病 学 研究 
( Reidelbach and Christl, 2002; Kozlov et al., 2005; 
Klink, 2010; Lock et al., 2014; Ciadamidaro et al., 
2016) [EX T 7E ERWA EES |I C TERI ESTER 
^, , HIP HE rl se e dde SEPA RU fri E , 若 采 用 传统 方 
式 进行 SSR 标记 的 开发 ,可 能 会 限制 SSR 标记 技术 
在 其 种 群 遗传 学 研究 中 的 应 用 。 因 此 ,本 研究 基于 
RNA-seq 数据 辅 以 MISA ( MIcroSAtellite 
identification tool, http: // pgrc. ipk-gatersleben. de/ 
misa/) SEYETE-BLACPTOSE 7E. E E9899 27] rb R5 (C H.E 
点 进行 挖掘 ,并 对 其 组 成 分布 及 特征 展开 了 分 析 ， 
以 期 为 开发 新 的 SSR 标记 提供 依据 ,为 深入 研究 其 
种 群 遗 传 学 和 生物 学 特性 提供 理想 的 分 子 标记 。 

















1 材料 与 方法 


1.1 供 试 虫 源 及 鉴定 

本 实验 用 于 验证 引物 的 窄 足 真 岗 幼虫 采 目 陕西 
省 宝鸡 市 和 新 疆 阿 勒 泰 地 区 。 参 照 《 中 国 晃 科 屁 
HYRA, 2016) 对 幼虫 样本 进行 形态 鉴定 , 然 
后 放 入 无 酶 EP 管 中 编 号 ,暂时 于 液 氮 中 保存 。 在 
超 净 工作 台 上 将 无 酶 EP 管 中 的 幼虫 用 无 菌 钞 子 取 
出 , 取 灼 烧 后 冷却 的 刀片 将 幼虫 体 躯 分 为 两 部 分 ,一 
部 分 仍 保存 于 无 酶 EP 管 中 ( 置 于 -807 冰箱 保 
f£) , 男 一 部 分 保存 于 普通 EP 管 中 ( 编 号 与 无 酶 EP 
管 号 码 相对 应 ) 进行 全 基因 组 DNA 提取 。 试 虫 基 
因 组 DNA 提取 采用 试剂 盒 法 (BSC26S1，Biospin 公 
司 )。 

采用 CO1 分 子 标 记 对 试 虫 进一步 确认 。CO7 Æ 
因 片 段 引 物 依照 Folmer 等 (1994) ;PCR 反应 体系 为 
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25 uL: F EERI EA DNA. 模板 2 uL,2 x Taq 
MasterMix 12. 5 uL, 上 下 游 引物 (10 umo/L) 各 
1 pL, 无 菌 水 补 至 25 uL, PCR 反应 程序 : 940 Ti 
变性 1 min; 94% 变性 1 min, 55*C3B X 1 min, 72%C 
延伸 1.5 min, 435 个 循环 ; 72% 延伸 7 min, PCR 
产物 经 1% 琼脂 糖 凝 胶 电泳 检测 。 选 择 条 带 清晰 的 
对 应 PCR 产物 送 由 上 海 生 工 生物 工程 有 限 公 司 进 
行 测序 ,于 NCBI 数据 库 进行 序列 比 对 。 比 对 结果 显 
zi m ^g I EC Simulium ( Eusimulium) angustipes。 
1.2 主要 实验 试剂 

实验 所 涉及 引物 均 由 上 海 生 工 生物 工程 有 限 公 
司 合成 ;2 x Taq MasterMix 购 自 于 ComWin Biotech 
公司 ; DL2000 DNA Marker, DL500 DNA Marker 和 
20 bp DNA Ladder 等 购 自 于 TaKaRa 公司 。 
1.3 RNA-seq 建 库 测 序 和 组 装 

陕西 和 新 疆 窗 足 真 映 幼 虫 的 转录 组 测序 委托 北 
京 诺 禾 致 源 生物 信息 科技 有 限 公 司 进行 ,测序 平台 
为 Illumina HiSeq 4000, 首先 对 RNA 样品 进行 检 
测 ,检测 内 容 主要 包括 RNA 降解 程度 以 及 是 否 有 污 
染 、RNA 的 纯度 检测 (0Dxo/ZOD>o 值 ) , RNA 浓度 定 
量 以 及 RNA 的 完整 性 检测 。 样 品 检测 合格 后 TIE 
有 Oligo( dT) 的 磁 珠 富 集 真 核 生 物 mRNA。 随 后 以 
mRNA 为 模板 ,合成 并 纯化 双 链 cDNA ,对 纯化 的 双 
链 cDNA 进行 末端 修复 .加 A 尾 并 连接 测序 接头 后 
进行 片段 大 小 选择 。 经 过 PCR 扩 增 及 PCR 产物 纯 
化 ,得 到 最 终 的 文库 。 库 检 合 格 后 即 可 上 机 测序 。 

对 测序 得 到 的 原始 数据 (raw reads ) 进行 过 滤 ， 
剔除 带 接 头 (adapter) N (N 表示 无 法 确定 碱 基 信 
E) 比例 大 于 10% 和 低 质 量 的 reads 后 ,得 到 去 杂 读 
长 (clean reads) , X} F TA 25 HEN 28 RW) 78 I EC 
需要 进行 de novo 测序 ( 缺 省 值 k-mer =25) , 即 经 由 
de novo 组 装 软件 Trinity 将 clean reads HIX NEE 
TIE contigs ,对 contigs 进行 Corset 层次 聚 类 和 去 宛 余 
处 理 , 取 最 长 的 一 条 转录 本 作为 gene, MIR ROZI 
种 的 unigene 库 用 于 后 续 分 析 。 
1.4 SSR 分 子 标记 开发 
1.4.1 SSR 位 点 鉴定 和 引物 设计 : 采用 软件 MISA 
(1.0 版, 默认 参数 ) 对 unigenes 进行 SSR 位 点 检 
测 ,搜索 参数 设置 为 :以 单 核 苷 酸 为 重复 单位 时 ,其 
复数 至 少 为 10 才 可 被 检测 到 ;以 双核 甘酸 为 重复 
单位 时 ,其 最 少 重复 数 为 6;3 -6 EC ERR S IP RES 
次 。 两 个 SSR 位 点 碱 基 间 隔 小 于 或 等 于 100 bp, 

根据 软件 MISA 的 输出 结果 ,采用 软件 Primer 
Premier 5.0 结合 Oligo 6. 7 设计 引物 ,引物 的 设计 基 






















































































于 以 下 标准 :(1) GC 含量 约 为 40% ~ 6096 之 间 ; 
(2)T,, 值 在 57 ~ 62C 78; (3) E PUES] GC E 
量 和 T, 值 保持 接近 ;(4) 引 物 序 列 长 度 在 18 ~ 24 
bp; (5) 预期 的 PCR 产物 大 小 为 100 ~290 bp; (6)3' 
端 Deta-G 值 绝对 值 不 超过 9 ; (7 ) Deta-G 值 S xi fU 
中 间 高 ,以 利于 序列 与 模板 结合 ;(8)T, 值 曲线 以 选 
取 72%C 附近 为 佳 ,5 -3' 呈 下 降 形状 ,使 有 利于 引发 
聚合 反应 。 

1.4.2 SSR 引物 扩 增 :PCR 反应 体系 为 25 mL:2 x 
Taq MasterMix 12 kL, 无 菌 水 9 uL, 7E EEIE 3. 
DNA 模板 2 pL, 上 下 游 引物 (10 pmol/L) 各 1 pL。 
反应 程序 :94% 预 变 性 2 min, 94% 变性 30 s,58%C 
退火 16 s, 72% 延伸 30 s, 4 36 个 循环 ;72% 延伸 
4 min。 

1.4.3 SSR 引物 的 多 态 性 分 析 及 功能 注释 :使 用 
296 琼脂 糖 凝 胶 初 步 检测 SSR 引物 是 否 具 有 特异 
性 。 根 据 引物 筛选 结果 , BE DL BU Vu ^ d EC AJ] 
虫 群体 25 头 个 体 进 行 SSR 标记 的 多 态 性 验证 , 扩 
增产 物 用 高 灵敏 度 的 8% 非 变性 聚 丙烯 酰胺 凝 胶 电 
泳 进 行 片 段 分 离 。PCR 产物 配 以 6 x loading buffer, 
保证 电泳 初始 所 有 样品 处 于 相同 水 平 位 置 。 吸 取 
0.5~1 kL 混合 物 至 点 样 孔 中 ,并 以 20 bp DNA 
Ladder 作为 标准 对 照 。 在 500 V 恒 压 下 电泳 h, 
0.2% AgNO, 溶液 染色 ,显影 液 (250 mL 1% NaOH + 
1 mL 3796 甲醛 ) 显 色 , 索 尼 数 码 相 机 拍照 记录 。 用 
软件 Gel-Pro Analyzer 4.0 分 析 电 泳 图 ,得 到 每 个 微 
卫星 位 点 基因 片段 的 长 度 , 即 可 确定 群体 中 各 个 体 
的 基因 型 。 所 得 数据 利用 软件 CONVERT 1. 31 转 
换 为 Cenepop 格式 ,利用 软件 Cervus 3. 0.7 计算 微 
卫星 标记 的 等 位 基因 数 Na 观测 杂 合 度 Ho 期望 杂 
合 度 He 、 多 态 信 息 含量 PIC 和 无 效 等 位 基因 频率 ， 
用 Genepop 4. 5. 1 判断 各 位 点 的 Hardy-Weinberg 平 
衡 偏离 情况 ;将 含有 多 态 性 SSR 的 unigenes 与 Nr 和 
Swiss-Prot 蛋白 质数 据 库 进 行 BlastX 比 对 注释 ( 玉 (f 
为 le -5)。 












































2 结 


2.1 RNA-seq 测序 及 组 装 结果 

对 窗 足 真 遇 幼 虫 转录 组 测序 共 获 得 103 035 130 
个 raw reads ,过 滤 后 得 到 99 370 228 个 clean reads, 
碱 基 错 误 率 为 0. 0296 , Q20 ( 碱 基 正 确 识别 率 为 
99% ) 3k 95.49% ,Q30( 碱 基 正 确 识 别 率 为 99.9% ) 
3^ 89.27% ,GC 含量 为 43.91% ,说 明基 于 RNA-seq 
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技术 的 测序 数据 质量 良好 。 组 装 后 共 获 得 窗 足 真 映 
幼虫 单 基 因 复 (unigenes) 43 129 个 ,平均 长 度 为 
1 555 bp (X 1) ,N50 值 为 2 492 bp。 对 于 转录 组 测 
序 而 言 ,一 般 其 组 装 序列 的 N50 值 大 于 500 才 可 用 








于 后 续 分 析 , 本 研究 的 测序 结果 表明 罕 足 真 遇 
unigenes 组 装 效果 良好 ,获得 了 较 高 准确 度 的 转录 
组 序列 。 本 研究 所 测 得 的 转录 组 数据 已 上 传 至 NCBI 
的 SRA 数据 库 ,登录 号 :SRP133998( 未 公开 ) 。 











表 1 窄 足 真 映 幼 虫 转录 组 单 基因 簇 的 长 度 统计 


Table 1 Length statistics of unigenes in the transcriptome sequences of the larva of Simulium (Eusimulium) angustipes 








最 小 长 度 (bp) 平均 长 度 (bp) 中 位 长 度 (bp) 最 大 长 度 (bp) N50 值 (bhp) ”N90 值 (bp) GEMA 
Minimum length Mean length Median length Maximum length N50 N90 Total nucleotides 
201 1 555 998 23 652 2 492 675 67 047 055 


2.2 "EIER eI SSR 序列 分 析 
使 用 软件 MISA 搜索 转录 组 数据 中 潜在 的 SSR 
基因 位 点 。 在 43 129 个 unigenes 中 共 鉴 定 出 29 471 
个 SSR ,重复 单元 类 型 共计 34 种 ,存在 于 15 549 个 
unigenes 中 ,发 生 频率 为 36.05% (SSR 所 在 unigenes 
数目 与 总 unigenes 数目 之 比 )。 在 所 有 含 SSR 序列 
中 ,6 684 个 unigenes 含有 多 个 SSR ,复合 型 SSR 共 
计 2 819 个 ( 表 2)。 在 29 471 个 SSR 中 ,最 丰富 的 
复 基 序 类 型 是 单 核 背 酸 重复 类 型 (25 655 个 , 占 
87.05% ) ,其 次 为 三 核 董 酸 重复 类 型 (2 344 Ô, i 
7.95% ) ,然后 是 二 核 昔 酸 (1 373 个 , 占 4.66% ) 和 
四 核 童 酸 (88 个 , 占 0.30% ) 的 重复 类 型 。 五 核 背 
酸 (4 个 , 占 0.01% ) MANERO 个 , 占 0.02% ) 




















表 2 





复 类 型 所 占 比 例 很 小 。 具 有 不 同 模 序 重复 次 数 
SSR 的 出 现 频率 见 表 3 , 窗 足 真 遇 幼 虫 转录 组 SSR 
重复 单元 的 重复 次 数 为 5 ~23 次 , 极 个 别 基 序 重复 
次 数 可 达到 29 次 (AGC/CTC) 和 35 次 (AG/CT) ,其 
至 50 次 (ACTAAGT); 从 表 3 可 以 得 出 单 核 背 酸 
复 次 数 大 多 为 10 ~ 14 K, ERERKEN 
6 ~9 次 ,三 核 苷 酸 重复 次 数 多 为 5 ~8 X PEOR IR 
重复 次 数 为 5 ~6 次 ,五 核 背 酸 和 六 核 苷 酸 重复 次 数 
分 布 比较 均匀 ,可 能 是 由 于 两 者 含量 少 的 原因 。 其 
中 ,具有 10 个 串联 重复 单位 的 SSR 最 常见 (15 270 
个 , 占 51.81% ) ,其 次 是 11 个 串联 重复 (4 643 个 ， 
占 15.7596) ,12 个 串联 重复 (1 890 个 , 占 6.41%) 
和 5 个 串联 重复 (1 733 个 , 占 5.88% ) 。 


























窄 足 真 映 幼 虫 转录 组 数据 SSR 分 析 的 基本 统计 


Table 2 Summary of the SSRs identified in the transcriptome sequences of the larva of Simulium (Eusimulium) angustipes 














SSR 信息 SSR information 








数量 Number 







































































于 标记 开发 的 unigenes 总 数 Total number of unigenes examined 43 129 
被 检测 unigenes 总 长 度 Total size of examined unigenes (bp) 67 047 055 
识别 的 SSR 总 数 Total number of identified SSRs 29 471 
含 SSR 的 unigenes 总 数 Number of SSR-containing unigenes 15 549 
包含 1 个 以 上 SSR 的 unigenes 数 Number of unigenes containing more than one SSR 6 684 
复合 型 SSR 总 数 Number of SSRs present in compound form 2 819 
表 3 基于 重复 单元 数目 的 SSRs 在 窄 足 真 映 幼 虫 转录 组 中 的 出 现 频 率 
Table3 Frequency of SSRs based on the number of repeat units in larval transcriptome of 
Simulium ( Eusimulium) angustipes 
重复 类 型 重复 数 Number of repeats 合计 百分比 
Repeat type 5 6 7 8 9 10 11 12 13 14 215 Total Percentage 
HIZR Mononucleotide 0 0 0 0 0 15244 4603 1882 833 533 2560 25655 87.05 
二 核 苷 酸 Dinucleotide 0 809 293 135 60 26 40 8 0 1 1 1 373 4.66 
三 核 苷 酸 Triucleotide 1656 464 187 29 0 0 0 0 0 0 8 2 344 7.95 
VUE ES Tetranucleotide 75 13 0 0 0 0 0 0 0 0 0 88 0.30 
TIZER Pentanucleotide 1 0 0 0 2 0 0 0 0 0 1 4 0.01 
六 核 背 酸 Hexaucleotide 1 1 1 1 0 0 0 0 0 2 1 7 0.02 
总 计 Total 1733 1287 481 165 62 15 270 4643 1890 833 536 2571 29471 - 
百分比 Percentage 5.88 4.37 1.63 0.56 0.21 51.81 15.75 6.41 2.83 1.82 8.72 - - 
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对 SSR 基 元 的 出 现 频率 进行 统计 (图 1) , 结 
显示 最 常见 的 SSR 基 序 是 AT ,高 达 86.9396 ,其 次 
是 AAC/GTT(4.43%), AC/GT (3. 5296 ) 和 AAT/ 
ATT(1.3596) , T&EC eR REP, AZT 基 序 所 占 比 
例 最 大 (86. 93% ) ; —ECH We E EE P EE AC/GT 
基 序 ( 占 3.5296) ,其 次 是 AG/CT HJF (5 0. 53% ) ; 
三 核 背 酸 重复 中 AAC/GTT 基 序 最 多 ( 占 4.4396) ， 
CCG/CGG 基 序 最 少 ( 占 0.1296 ) (图 1)。 其 他 基 元 
出 现 频率 百分比 超过 0. 296 的 有 AGC/CTG, ACC/ 
GGT, AAG/CTT 和 ACGZCGT。 基 序 出 现 频率 百 分 
比 超过 0.1% 的 有 C/G, ACT/AGT, CCG/CGG, 
AGG/CCT 和 AAAT/ATTT , 

2.3 SSR 引物 筛选 以 及 多 态 性 检测 

利用 软件 Primer Premier 5. 0 和 Oligo 6. 7 对 随 
机 挑选 的 含 SSR 位 点 的 unigenes 进行 引物 设计 , 初 
2p oed 15 对 能 扩 增 出 特异 性 条 带 的 引物 ,利用 陕 
西 群体 进行 多 态 性 检测 ,多 态 性 位 点 (Na 二 2) SA-3 
的 扩 增 产物 电泳 结果 见 图 2。 试 验 共 获得 12 个 具 
有 多 态 性 的 SSR 位 点 ,多 态 性 引物 ( 表 4) 比例 达到 
80% ,表明 依靠 RNA-seq 转录 组 数据 开发 SSR 引物 
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的 方法 可 行 。 

12 个 多 态 性 引物 在 窗 足 真 遇 陕 西 群体 25 头 幼 
虫 个 体 中 进行 了 扩 增 , 共 获 得 64 个 等 位 基因 ,等 位 
基因 数 范围 为 2 ~11 个 ,平均 每 位 点 产生 5.33 个 等 
位 基因 ,其 中 位 点 SA-1 等 位 基因 数 最 多 (11 个 )。 
守 足 真 遇 陕 西 群 体 的 各 遗传 多 样 性 参数 见 表 5 , 观 
测 杂 合 度 Ho WERKE He 和 多 态 信息 含量 PIC 
分 别 为 0. 000 ~ 0. 840, 0.344 ~ 0. 898 和 0. 291 ~ 
0.868。 位 点 SA-l, SA-5, SA-6, SA-9, SA-11 和 
SA-12 的 杂 合 度 较 高 ,适用 于 群体 遗传 多 样 性 分 析 ; 
各 个 位 点 的 PIC 波动 范围 为 0.291 ~0. 868 ,其 中 7 
个 位 点 是 高 度 多 态 位 点 (PIC > 0.5 ) ,其 余 5 个 位 点 
为 中 度 多 态 位 点 (0.25 < PIC «0.5) , NARE E 
真 映 遗 传 多样 性 研究 提供 可 靠 的 遗传 信息 。 利 用 软 
件 Genepop 对 各 位 点 进行 Hardy-Weinberg 平衡 检 
验 , 位 点 SA-4, SA-7, SA-8 和 SA-10 极 显著 偏离 哈 
温 平 衡 ,观察 发 现 上 述 4 个 位 点 的 观测 杂 合 度 Ho w 
著 低 于 期 望 杂 合 度 He ,说 明 出 现 偏离 哈 温 平衡 的 现 
象 可 能 是 由 于 这 些 位 点 杂 合子 不 足 。 
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图 1 SSRs 基 序 在 窜 足 真 映 幼虫 转录 组 中 的 出 现 频率 


Fig. 1 


Frequency of SSR motifs in larval transcriptome of Simulium ( Eusimulium) angustipes 
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Fig. 2 Polymorphic analysis of loci SA-3 in larvae of Shaanxi population of Simulium ( Eusimulium) angustipes 
M: DNA 分 子 量 标准 DNA molecular weight marker; 1 -25: 不 同 幼虫 个 体 Different larval individuals. 
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表 4 SSR 引物 序列 及 相关 信息 
Table 4 Sequences and related information for SSR primers 
3 " m E 基 序 和 重复 数 ”退火 温度 (% ) 
位 点 引物 序列 (5 -3^) 产物 大 小 (bp) ”、 ue 功能 注释 */E 值 
. Á . Motif and number Annealing 
Loci Primer sequences Product size Functional annotations/E value 
of repeats temperature 
F: TAACGCAACACTGGTCGACA AAELO00624-PA [| } i 
SA-1 183 (GT), 58 [埃及 3 
R: AACACTGGCCGACAAAAGG Aedes aegypti |/2. 4E — 147 
F: TGCGGATGGATGAAGCTCAA 
SA-2 100 (CA)s 58 无 Null 
R: CTTGTTGCCGGCTTTAGCTG 
F: TGACGGAGGAATCAAAGCGT AAEL009460-PA [ } i 
SA-3 124 (CAA)s¢ 58 [埃及 x 
R: TCTGCCATTCAAAGTGTGCG Aedes aegypti ]/1. 8E — 127 
F: CACCGTCCGAACTCAACCT AAELO06013-PA [埃及 j 
SA4 250 CGAA)6 58 . lR * 
R: TGAATCTCCTCCCTCACCA Aedes aegypti |/7. 7E — 162 
F: CCGTTTGACTGACACAGGGCA 
SA-5 166 (AC)6 62 无 Null 
R: CATCCTGTCTTGGCAGTGCA 
F: GTCTCCGCCATACTTGAGCA 
SA-6 248 (TG); 58 J Null 
R: AGTCACCCTGTCACAGCTTG 
F: TAGTCGGCGACAACGAGATC 
SA-7 205 《GT)6 58 J Null 
R: CCTGGACCTTTGGGATAACA 
GATAa2 转 GATAa2 
SAX F: AACGCACACAGACACAAACTTC ig (GCG) A io te 因 氏 按 蚊 
SA- CG transcript t 
R: ACTACTGATTGCTGGCAAATGA : MONA OU ROCK I d 
Anopheles darlingi |/5. 9E -73 
F: AGTGCGGGTATTTTCTTGTCCT 
SA-9 217 (GTTT); 62 无 Null 
R: AGCTCCGCACTTCATACCAC 
R% Æ Fd Hypothetical protein 
F: CACGTCAATGTACCGTCATGC 
SA-10 191 (AAT); 62 DVIR88 _ 6g0061 [ 果 晶 
R: AGGCTTAGTCAACATAGCTACTCG 
Drosophila virilis |/8. 3E —55 
fii du : Ka 164 Predicted; 
F; CCTCCATAAACGCGCGAGTA BW. RE A E 
SA-11 191 ( ATG) s 60 transmembrane protein 164 [ JE 35 
R: TCGTCCATAGTCGCGTTTGT 
十 蜂 Athalia rosae ]/5. 3E -82 
假想 蛋白 Hypothetical protein 
sie c c 149 (CAA) 58 ZHAS 00020363 [ p 4E f du 
(^ R; CTTCGCATTTGTGCCATT i MM PR 
Anopheles sinensis | /1. 6E — 83 
* 利用 Nr 和 Swiss-Prot 蛋白 质数 据 库 对 含有 多 态 性 SSR 的 unigenes 进行 了 功能 注释 (上 值 21e-5)., The SSR-containing unigenes were annotated 





using BlastX against Nr and Swiss-Prot databases with an E-value cutoff of 1e - 5. 


TEE ELSP EX PSP BE R 12 个 微 卫星 位 点 遗传 多 样 性 


表 5 


Table 5 Genetic diversity parameters of 12 SSR markers across Shaanxi population of Simulium ( Eusimulium) angustipes 









































位 点 Loci 等 位 基因 数 Na 观测 杂 合 度 Ho 期 望 杂 合 度 He 多 态 信息 含量 PIC 哈 温 平衡 P pwe 
SA-1 11 0. 720 0. 898 0. 868 0.0136 * 
SA-2 3 0.400 0.344 0.307 1.0000 
SA-3 4 0.440 0.478 0. 403 0.3964 
SA4 9 0.360 0.798 0.757 0.0000 ** 
SA-5 J; 0. 840 0.857 0.819 0.1202 
SA-6 6 0.640 0.730 0.671 0. 2702 
SA-7 3 0. 200 0.482 0. 393 0.0003 ** 
SA-8 2 0.125 0.361 0.291 0.0044 ** 
SA-9 4 0.520 0.545 0.487 0. 3705 
SA-10 4 0.000 0.744 0.681 0.0000 ** 
SA-11 7 0. 708 0.738 0.681 0.5706 
SA-12 4 0.520 0.611 0.525 0.0955 


* SSR 位 点 显著 偏离 哈 温 平衡 SSR loci significantly deviated from the Hardy-Weiberg equilibrium ( HWE) (P «0.05); ”SSR 位 点 极 显 著 


平衡 SSR loci extremely significantly deviated from HWE (P «0.01). 
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2.4 ERIZ AIE SSR 标记 的 功能 注释 
通过 对 含有 多 态 性 SSR BUE I ECL SE pq FE Ai 
与 NCBI 上 的 Nr 库 和 Swiss-Prot 蛋白 质数 据 库 进 行 
比 对 注释 (E [EX le -5) ,获取 与 近 缘 物 种 基因 序列 
的 相似 性 以 及 本 物种 基因 的 功能 信息 ,结果 有 7 个 
SSR 位 点 来 自 注释 基因 序列 ,其 中 3 个 位 点 可 注释 
到 埃及 伊 蚊 Aedes aegypti 相关 蛋白, 其余 位 点 分 别 
与 达 氏 按 蚊 Anopheles darlingi, rh 1E FÈ ur Anopheles 
sinensis Œ Rty Drosophila virilis IE IHI% Athalia 
rosae 的 已 知 功能 基因 相关 ( 表 4)。 这 些 SSR 位 点 
可 能 扮演 调控 基因 表达 的 角色 ,将 对 相应 基因 的 准 
确 筛 选 和 分 析 有 很 大 意义 。 























3 ”结论 与 讨论 




















在 本 研究 中 ,首次 应 用 高 通 量 Humina 测序 技 
术 对 无 参 物种 罕 足 真 晃 进行 测序 , 共 获 得 了 43 129 
个 unigenes , 7H ^E V] fri E 71 15 JE Fe EC e se 
组 数据 中 预测 出 29 471 种 潜在 的 SSR 标记 ,分 布 于 
15 549 个 unigenes 中 ,发 生 频 率 为 36.05% ,高 于 其 
他 许多 昆虫 的 SSR 发 生 频 率 ,如 东方 粘 虫 Mythimna 
separata (9. 84896) (2E fit SE, 2017) , RHET 5 E 
Dialeurodes citri (0. 41% ) (KEZ E, 2014) 、 烟 粉 乱 
Bemisia tabaci (5. 0796 ) ( Xie et al., 2012) , d 3& 2b 
Jj Phenacoccus solenopsis (5. 7996) ( 罗 梅 等 ， 
2014) bAt FH Galeruca daurica (4. 5396 ) (5% JÉ 
KÆ, 2016) RI Tb PERR Eogystia hippophaecolus 
(35.1496 )( 瞧 明明 等 , 2017) 等 。 由 此 推测 高 SSR 
发 生 频 率 是 窄 足 真 映 幼 虫 的 特征 之 一 ,同时 验证 了 
基于 RNA-seq 二 代 测 序 技术 可 实现 SSR 分 子 标记 
的 高 效率 开发 ,可 为 其 他 映 科 昆虫 的 SSR 分 子 标记 
挖掘 提供 借鉴 。 

^E E EINS IE SSR 位 点 种 类 丰富 ,共计 34 种 。 
其 中 单 核 苷 酸 重复 的 类 型 数目 最 多 ,出现 频 率 高 达 
87.05% ,重复 类 型 共计 2 种 ,分 别 为 AAT(86.92% ) 
fll C/G (0. 13% ) ;其 次 为 三 核 苷 酸 重复 类 型 ,所 占 
比例 为 7.95% ,重复 次 数 主要 集中 在 5 ~8 次 ,优势 
重复 基 元 类 型 为 AAC/GTT, AAT/ATT 和 ATC/ 
ATG; 二 核 苷 酸 重复 类 型 所 占 比 例 为 4.66% ,以 6 ~ 
9 次 重复 为 主 ,其 中 CG/CG 基 序 仅 有 6 个 ,验证 了 
前 人 研究 结果 , 即 在 动 植物 基因 组 或 转录 组 中 ,CG/ 






































2013) Ji; E Mythimna separata ( 8] $848 5$, 2015) , 
扶桑 绵 粉 内 P. solenopsis ( 罗 梅 等 , 2014) YLA un, 
FH G. daurica ( 5K HE KE, 2016) 、 黄 粉 虫 Tenebrio 
molitor ( 朱 家 颖 等 , 2013) 等 的 相关 研究 与 本 研究 结 
果 相 似 , 均 显示 单 核 苷 酸 重复 是 优势 重复 类 型 ,其 次 
为 三 核 音 酸 重复 ;在 不 考虑 单 碱 基 重 复 的 情况 下 LIH 
橘 全 爪 螨 Panonychus citri ( 88H35, 2016) 、 柑 桔 
HA D. citri( KZE, 2014) | fü] Sl Bactrocera 
dorsalis ( £8 PF] 4&, 2014) 、 叶 暗 ( Cicadellidae ) ( ijj 
德 辉 等 , 2013) ) 和 中 华 按 蚊 A. sinensis ( 攀 勇 和 马 雅 
ZÆ, 2008) 等 均 以 三 核 苷 酸 重复 作为 优势 核心 重复 
类 型 ,这 是 因为 三 核 苷 酸 基 序 是 昆虫 EST-SSR 中 的 
核心 重复 类 型 ,在 编码 区 域 ,三 核 苷 酸 核心 基 序 较 其 
他 重复 基 元 类 型 更 加 稳定 , 极 少 产生 编码 框 滑动 突 
变现 象 (Wang et al., 2012)。 

在 双 翅 目 昆虫 ,如 淡色 库 蚊 Culexpipiens pallens 
( 宋 锋 林 等 , 2004) RIE Anopheles lesteri ( 马 雅 
军 等 , 2008) 、 致 倦 库 蚊 Culex pipiens quinquefasciatus 
(Fonseca et al., 1998), [X] E MV. TZ W^ Anopheles 
gambiae ( Zheng et al., 1996) 以 及 tE h X ie B. 
dorsalis ( FIFI SE , 2014) rp, fedis ILAYI IAH R 
复 类 型 是 (ACZGT)n, 与 其 他 目 昆 虫 重复 类 型 不 同 
[ 沟 眶 象 Eucryptorrhynchus chinensis: AT/AT ( 武 政 
梅 等 , 2016); 叶 暗 ( Cicadellidae) : AGZCT( 胡 德 辉 
等 , 2013) ;中 华 蜜 蜂 Apis cerana cerana; AT/AT (能 
RAE, 2017); AER P. xylostella: GT/TG (np 
+E, 2013) ] KARRI GA H E REWI 
果 一 致 EW AE R E EJF F2 ( AC/GT) n 
T HE EEA H ERR 

在 合成 的 15 对 微 卫星 引物 中 ,7 对 引物 具有 高 
度 多 态 性 ,5 对 微 卫星 引物 表现 出 中 度 多 态 性 ,这 对 
于 后 续 进一步 探究 窜 足 真 晃 种 群 遗传 结构 、 遗 传 多 
样 性 及 其 种 群 多 样 性 的 形成 及 进化 机 制 等 均 具 有 重 
要 音义。 由 于 NCBI SEU E rp Wiz Eb dU fH ORE HH 
研究 进展 缓慢 ,6 个 含 多 态 性 SSR HEIE KEE 
释 到 其 他 双 翅 目 昆虫 , 推 测 这 些 SSR 序列 位 于 双 翅 
目 保 守 区 域 。 

EST-SSR 的 多 态 性 通常 低 于 G-SSR ,我 们 可 以 
通过 等 位 基因 数 .人 杂 合 度 等 遗传 参数 进行 判定 筛选 ， 
获得 可 用 于 遗传 学 研究 的 可 靠 标记 ;通过 转录 组 测 
序 可 获得 大 规模 的 SSR 序列 ,有 的 SSR 与 物种 基因 



























































































































































CG 是 SSR 重复 类 型 中 的 稀有 重复 基 元 ( 张 鹏 飞 等 ， 
2016) ;四 \ 五 六 核 背 酸 重复 类 型 所 占 比 例 很 小 。 
其 他 昆虫 如 小 菜 蛾 Plutella xylostella ( 柯 富士 ， 











表达 相关 ,有 利于 从 更 深层 次 揭示 物种 之 间 的 进化 
关系 。 本 研究 所 采取 的 聚 丙 烯 酰胺 凝 胶 电泳 / 银 数 
技术 虽 灵 敏 度 高 ,能 分 辨 出 1 个 碱 基 的 差别 ,但 是 过 
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程 繁杂 ,费时 劳力 ,对 于 大 样本 量 的 检测 有 一 定 的 难 
度 。 目 前 ,可 对 筛选 的 引物 进行 荧光 修饰 ,其 PCR 
产物 经 毛细 管 电泳 检测 后 ,数据 可 同步 输入 到 计算 
机 ,实现 高 通 量 检测 样本 ,快速 完成 基因 分 型 ,可 极 
大 地 促进 微 卫 星 标记 的 应 用 。 
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